欧美一区2区三区4区公司二百,国产精品婷婷午夜在线观看,自拍偷拍亚洲精品,国产美女诱惑一区二区

python數據處理常用方法

1、讀取指定sheet和指定列的內容

data = pd.read_excel("data.xlsx",sheet_name="Sheet1",usecols=["year","code1","code2","name","keywords","type",'new'])

?

2、遍歷數據,對兩列數據相似度比較

for i in range(0,75065):
? ? if data.loc[i]['code2']!=0:
? ? ? ? if data.loc[i]['code1'][:5]==data.loc[i]['code2'][:5]:
? ? ? ? ? ? data.loc[i,'inter']=0
? ? ? ? elif data.loc[i]['code1'][:3]==data.loc[i]['code2'][:3]:
? ? ? ? ? ? data.loc[i,'inter']=1
? ? ? ? elif data.loc[i]['code1'][:1]==data.loc[i]['code2'][:1]:
? ? ? ? ? ? data.loc[i,'inter']=2
? ? ? ? else:
? ? ? ? ? ? data.loc[i,'inter']=3

3、遍歷數據,統計每類分類變量的數量

list= ['fund','year','inter','age','degree','title','institute','economy','gender','type']
for i in range(0,10):
? ? print(data[list[i]].value_counts())

4、遍歷數據,刪除某列為特定值的數據

df_clear = data.drop(data[data['discipline']=="H"].index)

5、正則去掉字符串左邊或者右邊的內容

import re
template = "DF','17340','http://www.zgglkx.com','2021','205')"

delete_left = template.lstrip('"DF')
print(delete_left)

delete_right = template.rstrip('205\')')
print(delete_right)

文章鏈接: http://m.qzkangyuan.com/19221.html

文章標題:python數據處理常用方法

文章版權:夢飛科技所發布的內容,部分為原創文章,轉載請注明來源,網絡轉載文章如有侵權請聯系我們!

聲明:本站所有文章,如無特殊說明或標注,均為本站原創發布。任何個人或組織,在未征得本站同意時,禁止復制、盜用、采集、發布本站內容到任何網站、書籍等各類媒體平臺。如若本站內容侵犯了原著者的合法權益,可聯系我們進行處理。

給TA打賞
共{{data.count}}人
人已打賞
建站教程

服務器用什么Linux系統好

2023-3-31 12:23:35

建站教程

python數據處理常用方法(二)

2023-4-3 13:07:37

0 條回復 A文章作者 M管理員
    暫無討論,說說你的看法吧
?
個人中心
購物車
優惠劵
今日簽到
有新私信 私信列表
搜索
主站蜘蛛池模板: 巴彦县| 锡林郭勒盟| 西盟| 利川市| 黄陵县| 芒康县| 高平市| 绥芬河市| 桃源县| 新邵县| 洛宁县| 马鞍山市| 宝兴县| 仁布县| 任丘市| 册亨县| 梁河县| 宜阳县| 务川| 监利县| 巩留县| 嘉鱼县| 太原市| 临泽县| 宽城| 临夏市| 体育| 淅川县| 安顺市| 剑阁县| 额济纳旗| 延寿县| 永嘉县| 东丰县| 监利县| 托克托县| 同心县| 温州市| 邵阳县| 靖西县| 肥乡县|